Leitfaden zu Generative AI – RAG & Agentic AI

Einleitung

Generative AI (GenAI) hat sich von der einfachen Text- und Bildgenerierung zu komplexen Systemen wie KI-Agenten, Unternehmensautomatisierung und Schlussfolgerungsmaschinen weiterentwickelt. Dieser Leitfaden befasst sich mit den Kernkonzepten, Tools und Frameworks für die Entwicklung moderner GenAI-Anwendungen, darunter RAG, Multi-Agent-Systeme, Prompt Engineering und innovative Bibliotheken wie LangGraph.

Unabhängig davon, ob Sie Chatbots, Automatisierungsworkflows oder Wissenssysteme entwickeln, bietet dieser Leitfaden von IBM einen Überblick über die wesentlichen Entwicklungen, um den Überblick im "GenAI"-Dschungel nicht zu verlieren.

Kernkonzepte und Terminologie der GenAI

Grundlegende Konzepte

Begriff	Definition	Beispiele/Anwendungsfälle
LLM	Eine Art von KI-Modell, das anhand riesiger Textdatenmengen trainiert wurde, um menschenähnliche Sprache zu verstehen und zu generieren.	GPT-o1, Claude, LLaMA
Prompting	Eine Technik zum Entwerfen von Eingabeanweisungen, um die Ausgaben von LLM zu steuern.	„Schreibe eine Zusammenfassung in 3 Sätzen”, „Antworte als Experte für Cybersicherheit”.
Prompt-Vorlagen	Wiederverwendbare, strukturierte Prompts mit Platzhaltern für dynamische Eingaben.	„Erkläre {Konzept}, als wäre ich 5 Jahre alt.“
RAG	Retrieval-Augmented Generation: Kombiniert das Abrufen aus externen Wissensquellen mit der LLM-Generierung, um die sachliche Genauigkeit zu verbessern.	Beantwortung von Fragen mit Echtzeitdaten (z. B. RAG Paper)
Retriever	Eine Systemkomponente, die entwickelt wurde, um relevante Informationen aus einem Datensatz oder einer Datenbank abzurufen.	Vektorsimilaritätssuche mit FAISS, Elasticsearch
Agent	Ein autonomes KI-System, das mithilfe von Tools Aufgaben planen, begründen und ausführen kann.	AutoGPT, LangChain-Agenten
Multi-Agent-System	Ein Framework, in dem mehrere KI-Agenten zusammenarbeiten, um komplexe Aufgaben zu lösen.	Microsoft AutoGen, CrewAI
Chain-of-Thought	Eine Prompting-Technik, die Modelle dazu anregt, Probleme in Zwischenschritte zu zerlegen.	„Lassen Sie uns Schritt für Schritt vorgehen ...“
Hallucination Mitigation	Strategien zur Reduzierung falscher oder erfundener Ausgaben von LLMs.	RAG, Feinabstimmung, Prompt-Einschränkungen
Vektordatenbank	Eine Datenbank, die für die Speicherung und Abfrage von Vektor-Embeddings optimiert ist.	Pinecone, Chroma, Weaviate
Orchestrierung	Tools zur Verwaltung und Koordination von Workflows, an denen mehrere KI-Komponenten beteiligt sind.	LangChain, LlamaIndex
Fine-tuning	Anpassung vortrainierter Modelle für bestimmte Aufgaben unter Verwendung domänenspezifischer Daten.	LoRA (Low-Rank Adaptation), QLoRA (quantisierte Feinabstimmung)

Tools und Frameworks

Modellentwicklung und -bereitstellung

Tool	Definition	Beispiele/Anwendungsfälle	Link
Hugging Face	Eine Plattform, die vortrainierte Modelle und Datensätze für NLP-Aufgaben hostet.	Zugriff auf GPT-2, BERT, Stable Diffusion	Hugging Face
LangChain	Ein Framework zum Erstellen von Anwendungen mit LLMs, Agenten und Tools.	Erstellen von Chatbots mit Speicher und Websuche	LangChain
AutoGen	Eine Bibliothek zum Erstellen von Multi-Agenten-Konversationssystemen.	Simulation von Debatten zwischen KI-Agenten	AutoGen
CrewAI	Ein Framework zum Zusammenstellen kollaborativer KI-Agenten mit rollenbasierten Aufgaben.	Aufgabenautomatisierung mit spezialisierten Agenten	CrewAI
BeeAI	Ein leichtgewichtiges Framework zum Aufbau produktionsreifer Multi-Agenten-Systeme.	Verteilte Problemlösungssysteme	BeeAI
LlamaIndex	Ein Tool zur Verbindung von LLMs mit strukturierten oder unstrukturierten Datenquellen.	Erstellung von Q&A-Systemen für private Dokumente	LlamaIndex
LangGraph	Eine Bibliothek zum Aufbau zustandsbehafteter Multi-Akteurs-Anwendungen mit LLMs.	Zyklische Workflows, Agentensimulationen	LangGraph

Abruf und Infrastruktur

Tool	Definition	Beispiele/Anwendungsfälle	Link
FAISS	Eine Bibliothek für die effiziente Ähnlichkeitssuche von Vektorketten.	Abrufen der Top-k-Dokumente für RAG	FAISS
Pinecone	Ein verwalteter Cloud-Dienst für Vektordatenbankoperationen.	Speichern von Einbettungen für die Echtzeitabfrage	Pinecone
Haystack	Ein End-to-End-Framework zum Aufbau von RAG-Pipelines.	Bereitstellung von Unternehmenssuchsystemen	Haystack

Fortgeschrittene Prompting-Techniken

Konzept	Definition	Beispiel
Few-Shot-Prompting	Bereitstellung von Beispielen in der Eingabeaufforderung, um das Ausgabeformat des Modells zu steuern.	„Übersetzen Sie ins Französische: ‚Hallo‘ → ‚Bonjour‘; ‚Auf Wiedersehen‘ → __“
Zero-Shot-Prompting	Das Modell wird direkt aufgefordert, eine Aufgabe ohne Beispiele auszuführen.	„Klasifiziere diesen Tweet als positiv, neutral oder negativ: {Tweet}”
Chain-of-Thought	Förderung einer schrittweisen Argumentation.	„Berechne zuerst X. Vergleiche es dann mit Y. Endgültige Antwort: ___“
Prompt-Verkettung	Aufteilung komplexer Aufgaben in kleinere, nacheinander ausgeführte Aufforderungen.	Aufforderung 1: Schlüsselwörter extrahieren → Aufforderung 2: Zusammenfassung aus Schlüsselwörtern erstellen.

Wichtige Architekturen und Workflows

RAG-Pipeline

Abruf: Abfrage der Vektordatenbank (z. B. Pinecone) nach Kontext.
Erweiterung: Kombinieren Sie den Kontext mit der Benutzeraufforderung.
Generierung: LLM (z. B. GPT-4) erzeugt die endgültige Ausgabe.

Multi-Agent-System

Agenten: Spezialisierte Rollen (z. B. Forscher, Autor, Kritiker).
Orchestrierung: LangGraph für zyklische Workflows, AutoGen für Konversationen.
Tools: Websuche, Codeausführung, API-Integrationen.

Referenzen

← Zurück zur Übersicht